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预测 视角 下 双 因 子 模 型 与 高 阶 因子 模型 
的 一 般 性 模拟 比较 
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fü 要 高 阶 因子 模型 本 质 上 是 一 种 特殊 的 双 因 子 模 型 ， 应 用 中 却 常 被 当做 双 因 子 模型 的 竞争 模型 。 
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Us 


人 研究 以 


满足 比例 约束 的 双 因 子 模型 (此 时 等 价 于 一 个 高 阶 因子 模型 ) 为 真实 测量 模型 产生 模拟 数据 ， 比 较 了 


j 双 因子 模型 


和 高 阶 因子 模型 作为 测量 模型 的 预测 效果 。 本 文 使 用 不 满足 比例 约束 的 双 因 子 模型 (此 时 不 与 任何 高 阶 因子 模型 等 
价 ) 为 真实 测量 模型 产生 模拟 数据 进行 比较 , 所 得 结果 与 满足 比例 约束 的 双 因子 模型 的 结果 有 很 大 差别 ， 双 因子 模 


型 结构 系数 的 相对 仿 


差 较 小 、 检 验 力 较 高 , 但 第 [类 错误 率 略 高 。 


结论 是 ， 


在 比例 约束 条 件 成 立时 可 以 使 用 


高 阶 因 


子 模型 ， 否则， 从 统计 角度 看 ， 
关键 词 ” 结 构 系 数 ; 双 因子 模型 ; 
分 类 号 B841 


般 情况 下 使 / 


1 引言 


在 心理 、 教 育 、 管 理 等 研究 领域 , 常用 双 因 子 
模型 (bifactor model) 、 高 阶 因子 模型 (nigh-order factor 
model) 拟 合 多 维 构 念 (multidimensional construct). 
随 着 双 因 子 模型 的 应 用 领域 不 断 扩 大 ， 不 少 研究 者 
推荐 使 用 双 因 子 模型 拟 合 多 维 构 念 (Chen, Hayes, 
Carver, Laurenceau, & Zhang, 2012; Cucina & Byle, 
2017; Hyland, Boduszek, Dhingra, Shevlin, & Egan, 
2014; Salerno, Ingoglia, & Coco, 2017) 。 


] 双 因子 模型 进行 预测 比较 好 。 
高 阶 因子 模型 ， 比 例 约束 


& Balke, 1993; Schmid & Leiman, 1957), 但 研究 者 
常 把 两 种 模型 作为 竞争 模型 (Chen，et al, 2012; 
Chen, Jing, Hayes, & Lee, 2013; Cucina & Byle, 
2017; Gu, Wen, & Fan, 2017a; Hyland, et al., 2014). 
Chen 等 人 (2006) 基 于 实测 数据 比较 了 效 标 为 显 变 
量 时 ， 两 种 模型 的 拟 合 指数 和 结构 系数 (structural 
coefficient， 又 称 效 度 系 数 )。 徐 霜 雪 、 俞 宗 火 和 李 
日 梅 (2017， 后 面 简称 徐 文 ) 模 拟 研究 了 效 标 分 别 为 
显 变量 和 潜 变 量 时 ,两 种 模型 的 拟 合 指数 和 结构 系 
数 偏差 。 但 徐 文 的 研究 目的 和 结论 中 所 提 到 的 双 因 


TI E, WAP RAKE TOA SRO, dE 
负荷 满足 比例 约束 (proportion constrain) 时 ， 两 种 模 
型 等 价 (Schmid & Leiman, 1957; Yung, Thissen, & 
Mcleod, 1999)。 此 时 , 一 个 高 阶 因子 对 应 于 一 个 全 
局 因子 , 解释 所 有 题目 的 共同 变异 ; 一 阶 因 子 被 高 
阶 因 子 解 释 后 的 残 差 对 应 于 局 部 因子 , 表示 被 全 局 


子 模型 是 一 般 的 双 因 子 模型 ,而 在 其 模拟 研究 中 所 
使 用 的 双 因 子 模 型 却 是 满足 比例 约束 的 双 因 子 模 
型 (此 时 等 价 于 一 个 高 阶 因 子 模型 )。 

如 要 一 般 地 比较 双 因 子 模 型 和 高 阶 因子 模型 ， 
真 模型 应 该 有 两 个 一 一 满足 比例 约束 的 双 因 子 模 
型 (此 时 等 价 于 一 个 高 阶 因 子 模型 )、 不 满足 比例 约 


因子 解释 后 测量 该 因子 的 那些 题目 的 共同 变异 
(Chen, West, & Sousa, 2006), 一 般 情 况 下 ， 即 不 满 
足 比 例 约束 的 条 件 下 两 种 模型 并 不 等 价 (Gustafsson 
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束 的 双 因 子 模型 (此 时 不 等 价 于 任何 一 个 高 阶 因 子 
模型 )。 对 于 前 一 种 真 模型 产生 的 数据 ( 徐 文 已 做 )， 
无 论 用 双 因 子 模型 还 是 高 阶 因子 模型 去 拟 合 ， 都 是 
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拟 合 了 真 模型 ; 而 对 于 后 一 种 真 模型 产生 的 数据 
( 徐 文 未 做 )， 用 双 因 子 模型 是 拟 合 了 真 模型 ， 用 高 
阶 因 子 模型 则 拟 合 了 误 设 模型 。 

两 种 模型 参数 估计 和 检验 的 比较 , 徐 文 只 是 比 
较 了 结构 系数 估计 的 相对 偏差 。 其 实 还 应 当 比 较 统 
计 检 验 力 、 第 I 类 错误 率 ( 例 见 Gu, Wen, & Fan, 2017b; 
Wu, Wen, Marsh, & Hau, 2013), 才能 做 出 比较 全 面 
的 评价 。 此外, 徐 文 的 模拟 中 将 结构 系数 固定 不 变 ， 
其 实 结构 系数 也 作为 模拟 实验 的 条 件 进 行 设 计 比 
较 好 。 而 且 , 为 了 比较 检验 力 和 第 1 类 错误 率 ,这 
样 的 设计 是 必须 的 。 本 文 增 加 了 这 方面 的 工作 。 

本 文 将 通过 蒙特 卡 阁 (Monte Carlo) 模 拟 ， 用 两 
种 双 因 子 模型 (满足 和 不 满足 比例 约束 ) 产 生 数 据 ， 
人 研究 效 标 分 别 为 潜 变量 和 显 变量 时 ， 双 因子 模型 和 


高 阶 因 子 模 型 在 预测 视角 下 的 表现 ,系统 比较 结构 
系数 的 相对 偏差 、 统 计 检验 力 、 第 I 类 错误 率 等 。 


2 模型 概述 


21 MATRA 

双 因 子 模 型 又 称 为 全 局 -局 部 因子 模型 
(general-special factor model)， 如 图 1 中 的 M Bras. 
双 因 子 模型 假设 同时 存在 全 局 因子 (general factor) 
和 局 部 因子 (special factor), 全 局 因子 解释 所 有 题 
目的 共同 变异 ; 局 部 因子 解释 控制 了 全 局 因子 后 部 
分 题目 (测量 了 一 个 维度 ) 的 共同 变异 (Chen, et al., 
2006; ML, 温 忠 及，2017)。 该 模型 在 很 多 领域 
都 有 应 用 ， 如 管理 心理 学 、 健 康 心理 学 、 教 育 心理 
学 等 (Distefano, Greer, & Kamphaus, 2013; Howard, 
Gagné, Morin, & Forest, 2018; Wang, Fredricks, 
Hofkens, & Linn, 2016), 

假设 一 份 测验 由 m AP LA 2,5, x, ZL, 测 
量 了 一 个 全 局 因子 GM n 个 局 部 因子 51,S,,…,S,， 
则 题目 x, 可 以 表示 为 ( 叶 宝 娟 , me, 2012): 


yi 


x =a,G+ 9 b,S, *Ó,, i=1,2,---,m (1) 
j=l 


FOP, a 2A x ESAT GLAST, b; 是 题 
x 在 局 部 因子 5, 上 的 负荷 ，5; 是 题目 x 的 测验 误差 。 
该 模型 假设 全 局 因子 和 局 部 因子 不 相关 ， 局 部 


X11 


图 1 双 因 子 模型 M 和 高 阶 因子 模型 M, 


22 高 阶 因子 模型 
常见 的 高 阶 因子 模型 是 二 阶 因子 (second-order 
factor) 模 型 ， 如 图 1 中 的 M, Bros a 高 阶 因子 解释 全 
部 一 阶 因 子 (维度 ) 的 共同 变异 ,一 阶 因 子 解释 相应 
维度 的 一 组 题目 的 共同 变异 ( 顾 红 夭 , EB, 2017)。 
假设 一 份 测验 由 m 个 题目 x,x,,…,x%, 组 成 , 测 
量 了 一 个 高 阶 因子 GA n NAF A, BA, F 


则 题目 x; PY ARS RAS AS, mO, 成 子 娟 ， 
2004): 
x =) AF 6.i-l2,5m Q) 
j=l 
F,=hG+S,, j=1,2,…,n (3) 


其 中 , As H x, FEAF E; EY ftr, 5; 是 题目 
x; MIERE; hye AF Fj 在 高 阶 因 子 G 上 的 
负荷 , S 是 一 阶 因 子 已 被 高 阶 因子 G 解释 后 的 残 差 
(简称 为 一 阶 因 子 的 残 差 )， 对 应 于 双 因 子 模型 中 的 
局 部 因子 ,， 故 两 者 都 用 符号 S 表示 。 该 模型 假设 误 
差 间 不 相关 。 本 研究 采用 有 3 个 一 阶 因 子 ， 每 个 一 
阶 因子 4 个 题目 的 高 阶 因子 模型 。 
2.3 ”两 种 模型 的 关系 

高 阶 因 子 模型 舰 套 于 双 因 子 模 型 (Schmid & 
Leiman, 1957; Yung, et al., 1999), 任何 一 个 高 阶 因 
子 模型 都 可 以 转化 为 一 个 双 因 子 模型 。 原来 的 高 阶 


因子 之 间 可 以 相关 ; 误差 与 全 局 因子 、 局 部 因子 不 
相关 ， 且 误差 之 间 不 相关 。 辱 局 部 因子 之 间 也 不 相 
关 ， 则 为 正 交 双 因 子 模型 。 和 人 徐 文 一 样 ， 本 研究 采 
用 有 3 个 局 部 因子 、 每 个 局 部 因子 4 个 指标 的 正 交 
双 因 子 模型 。 


因子 变 成 了 全 局 因子 , 一 个 题目 x 在 全 局 因子 上 的 
负荷 a; 等 于 该 题目 在 一 阶 因子 fF 上 的 负荷 Aj RA 
该 一 阶 因 子 在 高 阶 因 子 上 的 负荷 h， 即 aj= Ag; 一 
阶 因子 ;被 高 阶 因子 解释 后 的 残 差 S, 变 成 了 局 部 
因子 ， 即 一 阶 因子 的 残 差 相 当 于 局 部 因子 , 题目 x 
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在 局 部 因子 S, 上 的 负荷 就 等 于 该 题目 在 一 阶 因 子 
上 的 负荷 Ay, 这 不 难 将 公式 (3) 代 人 公式 (2) 并 与 公 
式 (1) 比 较 推 必 出 来 (Demars, 2006; Schmid & Leiman, 
1957)。 

Schmid 和 Leiman (1957) 证 明 在 满足 比例 约束 
时 ， 两 种 模型 是 等 价 的 。 比 例 约束 是 指 , 在 每 个 维 
度 中 , 全 局 因子 的 负荷 和 局 部 因子 的 负荷 之 比 等 于 
一 个 常数 ， 此 常数 为 一 阶 因子 在 高 阶 因 子 上 的 负荷 
hj, 但 不 同 维度 中 这 个 常数 可 以 不 同 。 然 而 , 一 般 的 
双 因 子 模 型 是 不 满足 比例 约束 条 件 的 ， 实际 中 也 很 
难 找到 多 维 构 念 恰好 可 用 满足 比例 约束 条 件 的 双 
因子 模型 去 拟 合 。 例 如 , 在 Personality and Individual 
Differences 期 刊 发 表 的 关于 双 因 子 模型 应 用 的 文章 
中 ,有 33 篇 论文 报告 了 因子 负荷 ， 没 有 一 个 双 因 子 
模型 是 满足 比例 约束 的 。 
2.4 预测 视角 下 两 种 模型 的 关系 

在 双 因 子 模型 中 , 全 局 因子 作为 预测 变量 表示 
所 有 题目 的 共同 特质 对 效 标的 作用 ， 局 部 因子 作为 
预测 变量 表示 在 控制 了 全 局 因子 的 影响 后 ， 部 分 题 
目的 额外 共同 特质 对 效 标的 作用 ， 如 图 2 所 示 。 当 
有 nn 个 局 部 因子 时 ,公式 为 

Y=cG+ Vos, +e (4) 
j=l 

其 中 , e 表示 全 局 因子 G 对 效 标的 效应 大 小 , cj 表示 
局 部 因子 5S; 对 效 标的 效应 大 小 , e 表示 预测 残 差 。 
这 里 的 效应 就 是 所 谓 的 结构 系数 。Mplus 程序 见 附 
录 1。 


x12 


图 2 双 因 子 模型 Ms 对 效 标 变量 的 预测 


在 高 阶 因子 模型 中 , 虽然 可 以 直接 考虑 高 阶 因 
子 和 一 阶 因子 对 效 标的 作用 , 但 为 了 跟 徐 文 的 相应 
模型 一 致 ， 先 建立 如 下 模型 。 在 高 阶 因子 模型 中 ， 
高 阶 因子 作为 预测 变量 表示 一 阶 因 子 之 间 的 共同 
特质 对 效 标 的 作用 ,一 阶 因 子 的 残 差 ( 正 是 双 因 子 
模型 的 局 部 因子 ) 作 为 预测 变量 表示 部 分 题目 的 额 
外 共同 特质 对 效 标 的 作用 ,如 图 3 所 示 。 当 及 个 
一 阶 因子 时 , 公式 为 


Y=cG+)cS,+e (5) 
j=l 


其 中 , e 表示 高 阶 因 子 G 对 效 标的 效应 大 小 , cj 表示 
一 阶 因子 的 残 差 5 对 效 标的 效应 大 小 , e 表示 预测 
残 差 。 


图 3 高 阶 因 子 模型 My 对 效 标 变量 的 预测 


对 于 上 述 高 阶 因子 建 模 , EQS 软件 可 以 直接 使 
用 一 阶 因 子 的 残 差 作为 预测 变量 (Bentler 1995), 
但 Mplus 软件 仅 可 以 使 用 一 阶 因 子 作 为 预测 变量 
(Muthén & Muthén, 2012)。 把 公式 (3) 代 入 公式 (5) 
可 得 
Y -cG« j oS te - cG* o (F; -hjG) e 
j=l j=l 


[En je ton (6) 
Ja Jal 


根据 公式 (60)， 可 以 将 一 阶 因子 作为 预测 变量 ， 其 对 
效 标的 效应 与 一 阶 因子 的 残 差 作为 预测 变量 时 一 
模 一 样 ,但 此 时 高 阶 因 子 对 效 标 的 效应 为 Q&=c- 


ec 万 。 因 此 , 在 Mplus 软件 中 ,可 以 把 模型 设置 
j=l 
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为 高 阶 因子 和 一 阶 因子 作为 预测 变量 ， 然 后 利用 公 
式 c =d + 》cjh,, 便 可 以 转化 为 高 阶 因 子 和 一 阶 因 
j=l 


子 的 残 差 作为 预测 变量 的 结果 。Mplus 程序 见 附录 2. 
3 ”模拟 人 研究 


我 们 首先 重复 了 徐 文 的 模拟 研究 ， 即 真 模型 是 
满足 比例 约束 的 双 因 子 模型 。 无论 效 标 变量 是 显 变 


(4) 用 于 估计 的 模型 : 双 因 子 模型 Ms 和 高 阶 因 
子 模型 Mi。 

本 模拟 实验 是 4x3x3x2 的 混合 设计 , 前 3 个 因 
素 都 是 被 试 间 因素 ,最 后 一 个 因素 是 被 试 内 因素 。 
对 于 被 试 间 因素 , 共有 36 种 水 平 组 合 。 使 用 Mplus 
7.4 模拟 生成 1000 个 样本 数据 ， 即 每 种 组 合 重复 
1000 次 。 

全 局 因子 负荷 、 局 部 因子 负荷 、 结 构 系 数 、 样 


量 还 是 潜 变 量 , 在 估计 偏差 上 得 到 的 结果 与 徐 文 高 
度 一 致 ， 即 满足 比例 约束 的 情形 ,高 阶 因子 模型 结 
构 系 数 的 相对 偏差 比较 小 。 此 外 还 发 现 , 检验 力 方 
面 ， 若 真 模型 是 全 局 因子 和 局 部 因子 同时 作为 预测 
变量 ,整体 上 双 因 子 模 型 的 统计 检验 力 较 高 。 相 应 
地 ,无 论 真 模型 是 全 局 因子 还 是 局 部 因子 作为 预测 
变量 ,都 是 高 阶 因子 模型 的 第 I[ 类 错误 率 较 小 ,为 了 
节省 篇 幅 ， 这 里 不 报告 细节 。 

下 面 报告 真 模型 为 不 满足 比例 约束 的 双 因子 
模型 的 模拟 研究 ， 这 是 徐 文 没 有 做 的 情形 。 虽 然 我 
们 也 考虑 了 效 标 为 潜 变 量 和 显 变 量 的 两 种 设计 , 但 
因为 两 种 设计 的 结果 高 度 一 致 ， 所 以 下 面 只 报告 效 
标 为 潜 变 量 的 情形 , 与 徐 文 的 一 样 ， 效 标 潜 变 量 有 
3 个 指标 、 标 准 化 的 负荷 固定 为 比较 有 代表 性 的 0.7 
(也 见 Gu et al., 2017b)。 模 拟 研 究 设计 主要 是 针对 
预测 变量 的 测量 模型 进行 。 

31 ”研究 设计 

真 模型 为 不 满足 比例 约束 的 双 因 子 模型 ， 由 符 
合 下 列 条 件 的 双 因 子 模型 Ms 产生 数据 ,为 与 徐 文 
Xr, 参数 设计 尽量 与 徐 文 的 设计 一 致 ,但 本 文 对 
结构 系数 也 做 了 设计 (在 考虑 用 检验 力 和 第 I 类 错 
误 率 进行 评价 时 是 必须 的 )。 

(1) 全 局 因子 的 负荷 : 0.4, 0.5, 0.6 和 0.7。 全 局 
因子 共 12 个 题目 , 每 种 条 件 下 , 全 部 12 个 题目 在 
全 局 因子 上 的 负荷 都 相等 (Reise，Scheines， 
Widaman, & Haviland, 2013; 徐 霜 雪 等 , 2017)。 不 
满足 比例 约束 条 件 的 双 因子 模型 的 一 个 充分 (但 不 
必要 ) 条 件 是 , 不 同 题目 在 同一 个 局 部 因子 上 的 负 
fat 4 ASTRA, 但 在 全 局 因子 上 的 负荷 相等 。 My 每 个 
局 部 因子 的 4 个 题目 ， 其 负荷 分 别 设置 为 0.4，0.5， 
0.6, 0.7。 

(2) 全 局 因子 和 局 部 因子 的 结构 系数 设置 了 三 
种 组 合 : 0.3, 0.3; 0, 0.3; 0.3、0。 例 如 , 0、0.3 表 
示 全 局 因子 对 效 标的 效应 为 0,3 个 局 部 因子 对 效 标 
的 效应 都 是 0.3。 


200, 500 和 1000. 


本 容量 为 条 件 ,， 估计 的 模型 一 一 双 因 子 模 型 和 高 阶 
因子 模型 为 关注 对 象 。 据 此 可 以 在 不 同 数据 条 件 下 
进行 比较 , 包括 模型 拟 合 程度 、 结 构 系 数 的 相对 偏 
差 、 统 计 检 验 力 、 第 I 类 错误 率 , 还 可 以 了 解 当 全 局 
因子 和 局 部 因子 负荷 、 样 本 容量 变化 时 ， 比 较 指标 
的 变化 。 
3.2 ”结果 

本 文 除了 和 人 徐 文 一 样 报告 了 样本 容量 为 1000 
的 结果 外 ,同时 报告 样本 容量 为 500 和 200 的 结果 。 
3.2.1 适当 解 

排除 不 恰当 解 的 结果 ， 如 不 收敛 、 方 差 和 标准 
误 为 负 的 情形 , 仅 考 虑 恰当 解 的 情况 。 样 本 容量 ， 
1000 时 ,两 种 模型 的 收敛 率 都 在 99% 以 上 。 随 着 样 
本 容量 减少 ， 两 种 模型 的 收敛 率 降 低 , 但 都 在 9296 
以 上 ,最 大 相差 6%。 同 种 情况 下 , 高 阶 因 子 模型 的 
收敛 率 高 于 双 因 子 模型 。 
3.2.2 REWE 

一 般 认 为 ，CFI (comparative fit index) 和 TLI 
(Tucker-Lewis Index) 大 于 0.9, RMSEA (Root Mean 
Square Error of Approximation) #1] SRMR (Standardized 
Root Mean square Residual)/| T 0.08， 则 模型 整体 
拟 合 良好 (Marsh, Hau, & Wen, 2004; WER, ez 
泰 ， 马 什 赫 伯 特 , 2004)。 信 息 指数 AIC. ABIC 越 小 ， 
则 模型 拟 合 越 好 (Burnham & Anderson, 1998)。 所 有 
条 件 下 ， 双 因子 模型 拟 合 较 好 。 虽 然 高 阶 因 子 模型 拟 
合 比 双 因子 模型 差 , 但 也 达到 了 拟 合 良好 的 标准 。 
3.2.3 ”结构 系数 的 相对 偏差 

相对 偏差 (relative bias) 是 指 参 数 估计 值 的 平均 
数 和 真实 值 之 差 除 以 真实 值 ， 即 pias(6) = (mean(é) — 
c)/c, 用 于 衡量 估计 值 的 精度 。 一 般 认为 ,相对 偏 
差 的 绝对 值 在 5% 以 内 可 以 忽略 (Hoogland & Boomsma, 
1998), 在 10% 以 内 可 以 接受 , 且 可 以 认为 是 无 偏 估 
计 (Reise et al., 2013)。 和 徐 文 一 样 , 本 研究 比较 相 
对 偏差 的 绝对 值 。 

由 于 三 个 局 部 因子 (一 阶 因子 的 残 差 ) 为 预测 变 
量 时 ,三 条 路 径 作用 相同 , 这 里 只 考虑 其 中 一 条 路 
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径 (S1 因子 的 结构 系数 ) 的 结果 ,如 图 4 所 示 。 双 因 
子 模 型 结构 系数 的 相对 偏差 比 高 阶 因子 模型 的 普 
f, 但 存在 交互 作用 : 样本 容量 较 小 而 且 全 局 
因子 负荷 较 低 时 ， 双 因子 模型 结构 系数 的 相对 偏差 
较 大 ; 样本 容量 较 大 时 ， 双 因子 模型 结构 系数 的 相 
对 偏差 较 小 。85% 的 处 理 中 ， 双 因子 模型 结构 系数 
的 相对 偏差 小 于 10%。 随 着 样本 容量 的 增加 ,整体 上 
两 种 模型 结构 系数 的 相对 偏差 变 小 。 此 外 , 全 局 因子 
负荷 越 大 ， 双 因子 模型 结构 系数 的 相对 偏差 越 小 。 
3.2.4 统计 检验 力 

统计 检验 力 (power) 是 指 真 值 不 为 0 时 , 估计 值 
显著 不 等 于 0 的 概率 。 统 计 检 验 力 越 接 近 1 越 好 。 
由 图 5 可 见 , 在 所 有 条 件 下 ,都 是 双 因 子 模型 的 统 
计 检 验 力 比较 高 。 样 本 容量 越 大 ， 两 种 模型 的 统计 
检验 力 都 越 高 。 此 外 , 全 局 因子 负荷 越 大 ， 两 种 模 
型 的 统计 检验 力 都 越 高 。 
3.2.5 第 工 类 错误 率 

第 I 类 错误 率 (type I error rate) 是 指 真 值 为 0 时， 
估计 值 显著 不 等 于 0 的 概率 。 一 般 认为 第 I 类 错误 


率 越 接近 真 值 0.05 越 好 , 在 0.025~0.075 之 间 是 可 以 
接受 的 (Bradley & James, 1978; Mackinnon, Lockwood, 
& Williams, 2004; Wu et al., 2013). 

MIEJ B9 28 RR, UIP BOY SL 288 
误 率 比较 大 ( 见 图 6)。 当 NW = 1000 时 , 在 模拟 的 各 
种 条 件 下 两 种 模型 的 第 I 类 错误 率 几乎 都 在 可 接受 
范围 ,但 在 样本 容量 较 小 而 且 全 局 因子 负 葵 较 低 时 ， 
双 因 子 模型 的 第 I 类 错误 率 大 于 可 接受 的 范围 。 全 
局 因子 负荷 越 大 ， 双 因子 模型 的 第 I 类 错误 率 越 接 
yr 0.05, 
33 小结 

本 模拟 研究 是 徐 文 没 做 的 一 个 新 研究 ， 产生 数 
据 的 双 因 子 模型 不 等 价 于 任何 一 个 高 阶 因 子 模型 。 
多 数 情况 下 ， 双 因子 模型 结构 系数 的 相对 偏差 比较 
小 , 尤其 是 当 N= 1000 的 时 候 ， 双 因子 模型 一 致 小 
于 高 阶 因子 模型 。 但 在 N 小 的 时 候 ， 两 种 模型 的 相 
对 偏差 大 小 比较 没有 一 致 的 结果 ,尤其 是 全 局 因子 
的 负荷 较 小 时 。 检 验 力 方面 , 各 种 情况 下 都 是 双 因 
子 模型 的 比较 高 。 相 应 地 ,无 论 真 模型 是 全 局 因子 
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séees @@…… Bifactor model 


图 4 不 满足 比例 约束 条 伯 


— —k— —— High-order factor model 


时 结构 系数 的 相对 偏差 


注 : 横 轴 G 表示 全 局 因子 负荷 (下 同 ); 纵 轴 G-Bias% 表 示 G 因子 的 结构 系数 的 相对 偏差 ; S1-Bias% 表 示 S1 因子 的 结构 系数 的 相对 偏差 。 
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图 6 不 满足 比例 约束 条 件 时 结构 系数 的 第 I 类 错误 率 


G-I Error 表示 G 


因子 的 结构 系数 的 第 I 类 错误 率 , S1-I Error 表示 S1 


因子 的 结构 系数 的 第 1 类 错误 率 。 
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还 是 局 部 因子 作为 预测 变量 ， 都 是 双 因 子 模 型 的 第 
I 类 错误 率 比 较 大 。 


4 结论 和 讨论 


徐 文 研究 以 满足 比例 约束 的 双 因 子 模型 (此 时 


标 也 达到 要 求 ， 是 可 以 接受 的 。 但 高 阶 因 子 模型 可 
以 接受 , 并 不 能 说 它 优 于 双 因 子 模型 。 

高 阶 因子 模型 的 高 阶 因子 定义 在 一 阶 因 子 上 
而 非 观测 变量 (题目 ) 上 ,因此 高 阶 因 子 对 观测 变量 
没有 直接 效应 , 一 阶 因子 相当 于 中 介 变 量 , 高 阶 因 


等 价 于 一 个 高 阶 因子 模型 ) 为 真实 测量 模型 产生 模 
拟 数据 ， 比 较 了 用 双 因 子 模型 和 高 阶 因 子 模型 作为 
测量 模型 的 结构 系数 。 在 其 研究 中 ,无论 使 用 的 是 
双 因 子 模 型 还 是 高 阶 因子 模型 ， 都 是 拟 合 了 真 模 


子 对 观测 变量 的 作用 完全 通过 一 阶 因子 的 作用 实 
现 (Gignac, 2008; MALAR, WGE, 2017)。 而 双 因 子 
模型 的 全 局 因子 和 局 部 因子 都 直接 定义 在 观测 变 
EE, 对 观测 变量 都 是 直接 效应 有 时 候 更 易 解 释 全 


型 。 本 文 使 用 不 满足 比例 约束 的 双 因子 模型 为 真实 
测量 模型 产生 模拟 数据 进行 比较 , 无 论 结果 是 否 与 
徐 文 相 同 ， 都 是 有 意义 的 。 徐 文 的 模拟 研究 结果 只 
能 说 明 , 满足 比例 约束 条 件 时 , 高 阶 因 子 模型 结构 
系数 的 相对 偏差 更 小 。 但 一 般 情况 下 比例 约束 条 件 
是 不 满足 的 , 在 此 种 情况 下 ， 如 果 徐 文 的 结果 还 正 
确 ， 则 可 将 徐 文 结果 推广 到 很 一 般 的 范围 ， 如 果 徐 
文 结果 不 再 正确 ， 则 本 文 的 意义 更 大 。 此 外 ,本文 
从 多 角度 比较 了 两 种 模型 的 表现 , 包括 拟 合 指数 、 
结构 系数 的 相对 偏差 、 统 计 检 验 力 、 第 I 类 错误 率 。 

当真 模型 满足 比例 约束 条 件 时 , 与 双 因 子 模型 
相 比 ， 高 阶 因子 模型 结构 系数 的 相对 偏差 较 小 (这 
和 人 徐 文 的 结果 一 致 ); 第 I 类 错误 率 较 低 , 但 检验 力 
也 较 低 。 两 种 模型 的 拟 合 程度 差别 不 大 ,都 达到 拟 
合 良 好 的 标准 。 考 虑 到 高 阶 因子 模型 比较 省 检 ( 目 
由 度 更 大 )， 当 模型 满足 或 近似 满足 比例 约束 条 件 
时 ,首选 高 阶 因子 模型 进行 预测 ， 尤 其 是 样本 容量 
较 大 时 , 检验 力 较 低 的 缺点 会 消失 。 

当真 模型 不 满足 比例 约束 条 件 时 ， 使 用 高 阶 因 


局 因子 、 局 部 因子 和 效 标 变量 之 间 的 关系 (Beaujean， 
Parkin, & Parker, 2014; Chen et al., 2006)。 特 别 是 当 
使 用 高 阶 因 子 模型 结果 不 理想 的 时 候 ， 双 因子 模型 
是 值得 考虑 的 蔡 代 模 型 。 

本 研究 中 发 现 若 不 满足 比例 约束 条 件 ， 样 本 容 
量 为 1000 Af, 双 因 子 模型 的 第 I 类 错误 率 基本 上 可 
以 接受 ; 样本 容量 为 500 时 , 近 六 成 的 处 理 中 双 因 
子 模 型 的 第 工 类 错误 率 都 在 可 接受 的 范围 内 。 因 此 ， 
使 用 双 因 子 模 型 时 样本 宜 大 一 些 ， 比 如 不 小 于 
500。 此 外 ,高 阶 因子 模型 尤其 是 双 因 子 模型 较 难 收 
敛 ,样本 容量 武大 越 有 助 于 提高 收敛 性 ， 而 且 大 样 
本 (如 超过 500) 得 到 的 预测 偏差 基本 上 在 可 接受 范 
围 ， 也 有 较 高 的 检验 力 。 

有 时 候 根据 常用 的 拟 合 指数 可 能 不 知道 是 用 
双 因 子 模型 还 是 高 阶 央 子 模型 拟 合 多 维 构 念 较 好 ， 
但 模拟 研究 发 现 满足 比例 约束 的 双 因 子 模 型 和 不 
满足 比例 约束 的 双 因 子 模型 的 信息 指数 (例如 ， 
AIC、ABIC) 表 现 不 一 。 对 于 AIC 和 ABIC, 满足 比 
例 约束 条 件 时 双 因 子 模 型 的 比较 大 ， 而 不 满足 比例 


子 模型 可 以 说 是 拟 合 了 误 设 模型 。 即 使 高 阶 因子 模 
型 的 拟 合 指数 还 是 可 以 接受 , 但 比 双 因 子 模型 拟 合 
要 差 。 更 重要 的 是 , 与 高 阶 因 子 模型 相 比 ， 双 因子 


约束 条 件 时 高 阶 因子 模型 的 比较 大 。 在 实证 研究 中 ， 
可 以 通过 比较 两 种 模型 的 AIC 和 ABIC 判断 哪个 更 
适宜 拟 合 多 维 构 念 。 如 果 双 因子 模型 的 AIC, BIC 


模型 结构 系数 的 相对 偏差 普遍 较 小 , 尤其 是 当 入 较 
大 的 时 候 。 这 与 徐 文 的 结果 正好 相反 ,所 以 徐 文 的 
结果 没有 普遍 性 。 此 外 , 各 种 情况 下 都 是 双 因 子 模 
型 的 统计 检验 力 较 高 ,相应 地 , 第 I 类 错误 率 也 略 
高 (尤其 样本 容量 比较 小 的 时 候 )。 总 之 ， 当 模型 不 满 
足 比例 约束 条 件 时 (通常 的 应 用 属于 此 种 情况 )， 从 
统计 角度 不 能 说 高 阶 因 子 模型 比 双 因 子 模型 还 好 。 

那么 ,是 不 是 在 预测 视角 下 ， 就 优先 考虑 双 因 
子 模型 呢 ? 也 不 是 ， 而 是 应 当 从 学 科 理 论 出 发 、 结 
合 研 究 目的 选用 模型 。 与 双 因 子 模型 相 比 ， 高 阶 因 
子 模型 不 仅 更 加 简洁 ， 而 且 其 中 的 一 阶 因 子 比 局 部 
因子 更 容易 理解 。 如 果 研 究 者 使 用 高 阶 因 子 模型 进 
行 预测 ， 而 整个 模型 已 经 拟 合 良 好 ,， 且 各 项 评价 指 


较 大 , 倾向 于 选用 高 阶 因子 模型 ， 否则 考虑 使 用 双 
因子 模型 研究 结构 系数 ， 也 便于 进一步 解释 多 维 构 
念 与 效 标 之 间 的 关系 。 

为 了 比较 徐 文 结果 , 本 研究 与 徐 文 一 样 使 用 正 
交 双 因子 模型 。 但 正 交 双 因子 模型 假设 局 部 因子 间 
不 相关 。 在 更 一 般 的 情况 下 ， 即 双 因 子 模型 的 局 部 
因子 允许 相关 ， 本 研究 结果 是 否 全 部 成 立 ， 有 待 进 
一 步 研 究 。 
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附录 1 
TITLE: Bifactor model 
DATA: FILE = pl.dat; ! 文 件 名 
VARIABLE: NAMES = yl-y3 x1-x12; ! 变 量 命 名 
MODEL: 
Y by yl-y3; ! Y 表示 效 标 变量 
S1 by x1-x4*; 
S2 by x5-x8*; 
S3 by x9-x12*; !S1-S3 表示 局 部 因子 
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G by xl-xl2*;! G 表示 全 局 因子 F1 by x1-x4; 
G@1; S1-S3@1; G with S1-S3@0; S1-S3 with S1- F2 by x5-x8; 
S3@0; F3 by x9-x12; !F1-F3 表示 一 阶 因子 
Y ONG SI-S3;! 全 局 因子 和 局 部 因子 作为 预测 变量 G by F1-F3*(h1-h3);! G 表示 高 阶 因子 
OUTPUT: stdyx; G@1; F1-F3(g)l; 
Y ON G*(d) 
附录 2 F1-F3*(c1-c3);! 高 阶 因子 和 一 阶 因 子 作为 预测 变量 
TITLE: High-order factor model MODEL CONSTRAINT: 
DATA: FILE = pl.dat; ! 文 件 名 NEW (c); ! c 为 高 阶 因子 和 一 阶 因子 的 残 差 作为 
VARIABLE: NAMES = yl-y3 xl-xl2;! 变 量 命名 预测 变量 时 ， 高 阶 因 子 的 结构 系数 。 
MODEL: c=dth1 *cl+h2*c2+h2*c2; 
Y by yl-y3; ! Y 表示 效 标 变量 OUTPUT: stdyx ; 


A general simulation comparison of the predictive validity between 
bifactor and high-order factor models 


WEN Zhonglin'; TANG Dandan'; GU Honglei? 


( Center for Studies of Psychological Application / School of Psychology, South China Normal University, Guangzhou 510631, China) 
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Abstract 


Mathematically, a high-order factor model is nested within a bifactor model, and the two models are 
equivalent with a set of proportionality constraints of loadings. In applied studies, they are two alternative models. 
Using a true model with the proportional constraints to create simulation data (thus both the bifactor model and 
high-order factor model fitted the true model), Xu, Yu and Li (2017) studied structural coefficients based on 
bifactor models and high-order factor models by comparing the goodness of fit indexes and the relative bias of the 
structural coefficient in a simulation study. However, a bifactor model usually doesn't satisfy the proportionality 
constraints, and it is very difficult to find a multidimensional construct that is well fitted by a bifactor model with 
the proportionality constraints. Hence their simulation results couldn't extend to general situations. 

Using a true model with the proportionality constraints (thus both the bifactor model and high-order factor 
model fitted the true model) and a true model without the proportionality constraints (thus the bifactor model 
fitted the true model, whereas the high-order factor model fitted a misspecified model), this Monte Carlo study 
investigated structural coefficients based on bifactor models and high-order factor models for either a latent or 
manifest variable as the criterion. Experiment factors considered in the simulation design were: (a) the loadings 
on the general factor, (b) the loadings on the domain specific factors, (c) the magnitude of the structural 
coefficient, (d) sample size. When the true model without proportionality constraints, only factors (a), (c) and (d) 
were considered because the loadings on domain specific factors were fixed to different levels (0.4, 0.5, 0.6, 0.7) 
that assured the model does not satisfy the proportionality constraints. 

The main findings were as follows. (1) When the proportionality constraints were held, the high-order 
factor model was preferred, because it had smaller relative bias of the structural coefficient, and lower type I 
error rates (but also lower statistical power, which was not a problem for a large sample). (2) When the 
proportionality constraints were not held, however, the bifactor model was better, because it had smaller relative 
bias of the structural coefficient, and higher statistical power (but also higher type I error rates, which was not a 
problem for a large sample). (3) Bi-factor models fitted the simulation data better than high-order factor models 
in terms of fit indexes CFI, TLI, RMSEA, and SRMR whether the proportionality constraints were held or not. 
However, the bifactor models were less fitted according to information indexes (i.e., AIC, ABIC) when the 
proportionality constraints were held. (4) Whether the criterion was a manifest variable or a latent variable, the 
results were similar. However, for the manifest criterion variable, the relative bias of the structural coefficient 
was smaller. 

In conclusion, a high-order factor model could be the first choice to predict a criterion under the condition of 
proportionality constraints or well fitted for the sake of parsimony. Otherwise, a bifactor model is better for studying 
structural coefficients. The sample size should be large enough (e.g., 500+) no matter which model is employed. 

Key words structural coefficient; bifactor model; high-order factor model; proportionality constraints 


